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مقدمة عن علم التنقيب عن البيانات 
ele‏ التنقيب عن البيانات ale Data Mining‏ مستقل بحد ذاته » ولو أن بعض الباحثين يرى ربطه بعلم استجلاب المعلومات 
c Information Retrieval‏ نظرا GY‏ هذا الأخير يعتبر أقدم بكثير من ال Data Mining‏ و GS!‏ يرى العديد من الباحثين 
أيضا أن نضوج مواضيع هذا العلم يجعله علم مستقل بحد ذاته . 
بعبارة بسيطة جدا ( قد تكون مخلة بعض الشيء ولكن لغرض التبسيط سأسردها ) يعتبر علم تنقيب البيانات العلم المسئول عن 
أساليب و طرق إنتاج المعلومات و قواعد المعرفة من خلال كم كبير من البيانات التي يتم التنقيب فيها و ربطها بأساليب علمية 
لنخرج بمعلومة أو معرفة جديدة 
على سبيل المثال لا الحصر ¢ التصنيف الأوتوماتيكي للمستندات يعتبر من الجوانب التي يتناولها ele‏ ال Data Mining‏ « 
فهناك العديد من الخوارزميات التي من شأنها تصنيف المستندات بعد إعطائها كم هائل من البيانات مربوطة بنوع هذه البيانات 
tuus s‏ على الك فقا فقا Dis‏ الس اعدا عل Ads‏ الريب 
دعني أضرب مثال عملي أكثر ... الجميع يعرف فلاتر البريد المزعج ) Spam Email‏ ( التي تستخدمها شركات مثل 
!Yahoo‏ و Gmail‏ و Hotmail‏ ... الكل ales‏ فائدتها و استخداماتها » ولكن طريقة عملها يجهلها الكثير ... تعمل هذه 
البرمجيات باستخدام خوارزمية تعرف ب Naive Bayesian‏ » هذه الخوارزمية أو القانون من قوانين ale‏ الإحصاء .. 
لست هنا بصدد شرح هذه الخوارزمية » ولكن لأذكر مثالا على استخدامات ale‏ ال Data Mining‏ في التطبيقات Cus c‏ 
أصبح ال Naive Bayesian Classifier‏ يدرس بكثافة في تطبيقات هذا العلم . 
ما هي أو ما معنى التنقيب في البيانات ؟ 
هي عملية بحث محوسب ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة. 
تعريف آخر:- 
هي عبارة عن تقنية تستخدم في عملية استخراج البيانات من قواعد بيانات عملت مثل قاعدة : 
Data ware haws‏ 


Working with data mining 
تمكنك من الوصول إلي المعلومات التي تحتاجها لصناعة القرارات الذكية وذلك حول مشاكل الإعمال التجارية الصعبة‎ : Dm 


هناك هدفان أساسيان للتنقيب في البيانات هم: 


التنقيب ألاستشرافي والتنقيب الوصفي. التنقيب ألاستشرافي ينتج عنه نموذج عن النظام الذي تصفه البيانات المستخدمة 
في التنقيب. أما التنقيب الوصفي فنتج معلومات جديدة بناء على المعلومات الموجودة داخل البيانات المستخدمة في عملية 
التنقيب. العمليات الأساسية التي تعتبر ضمن عمليات أو مهام التنقيب هي: 

التصنيف 

الانحدار 

العنقدة (التجميع ) 

التلخيص 

. نماذج الاعتماد 


الكشف عن التغيرات والانحرافات 


هناك ثلاثة أهداف للتنقيب في البيانات : 


-١‏ من أجل تعليل بعض الظواهر المرئية. مثال: لماذا زادت نسبة المدخنين في الوطن العربي؟ 


-Y‏ من أجل التثبت من نظرية ما. مثال: التثبت من النظرية التي تقول بأن الأسر الكبيرة تهتم بالضمان الصحي أكثر من 
الأسر الصغيرة Jae‏ 


-Y‏ من أجل تحليل البيانات للحصول على علاقات جديدة وغير متوقعة. مثال: كيف سيكون الإنفاق العام إن كان ملازما 


وسائل التنقيب في البيانات : 


هناك عدة وسائل مختلفة من أجل التنقيب في البيانات. اختيار الوسيلة المناسبة يعتمد على طبيعة البيانات تحت الدراسة 


وعلى حجمها. يمكن اجراء عملية التنقيب في البيانات بالمقارنة مع سوق البيانات ومخزن البيانات. 

بعض من هذه الوسائل هي : 
- التفكير واستخلاص النتائج والقوانين من All‏ حيةع163501 Case-Based‏ 
- الكشف عن قانون Rule Discovery:‏ البحث عن منوال معين أو علاقة معينة في جزئية كبيرة من البيانات 
- معالجة الإشارات Signal Processing:‏ إيجاد الظواهر المتشابه مع بعضها البعض 


- شبكات نووية Neural Nets:‏ تطوير نماذج قابلة sl‏ النتائج. هذه النماذج e‏ تطويرها بناءا على أسس تم استنباطها 
من عقل الإنسان. 


- منحنيات غير ثابتة Fractals:‏ تصغير البيانات الكبيرة من دون ضياع المعلومات 
تطبيقات التنقيب في البيانات : 
وسائل التنقيب فى البيانات تُستعمل وبنجاح فى الكثير من التطبيقات الحقيقة حول العالم. التطبيقات التالية تشمل بعضا من الأمثلة 


- كتابة تقرير مختصر عن A‏ معينة Profiling Populations:‏ تطوير وإنشاء تقارير موجزة عن الزبائن المهمين 
وعن بطاقات الائتمان. 


- تحليل النزعة التجارية Analysis of Business Trend:‏ إيجاد الأسواق ld‏ قدرات النمو القوية أو الضعيفة. 


- التسويق لفئة معينة Target Marketing:‏ إيجاد الزبائن من أجل منح التخفيضات لهم لسبب معين. 


- تحليل الاستعمال Usage Analysis:‏ إيجاد منوال معين لاستعمال الخدمات والسلع 


- فعالية الحملة Campaign Effectiveness:‏ مقارنة استراتيجيات الحملات مع بعضها البعض من أجل ايجاد أكثرها 
فعالية وتأثيرا. 


-.كاتبية السلعة» slag)‏ الع التي قاع هم شا send‏ 
تطبيقات التنقيب في البيانات بدأت تنمو بصورة كبيرة للأسباب التالية: 


١‏ كمية البيانات الموجودة في مخزن البيانات وسوق البيانات تنمو بصورة أساسية (exponential).‏ ومن أجل «ll‏ فان 
المستخدم يحتاج إلى أدوات متطورة من مثل التنقيب في البيانات من اجل استخلاص الفائدة والمعرفة من هذه البيانات. 


2- الكثير من أدوات التنقيب عن البيانات بدأت تظهر مؤخراء وكل أداة أفضل من الأخرى. 


3- المنافسة الشديدة الموجودة في السوق تدفع الشركات إلى الاستفادة القصوى من البيانات التي بيدها. عمليات التنقيب في 
البيانات تفعل ذلك تماما. 


Microsoft SOL Server Analysis (SSAS) 
Microsoft SQL Server 


يقوم بتزويد الأدوات لل Dm‏ والتي تقوم بتعريف القواعد والنماذج في بياناتك ولذلك يمكن تحديد لماذا 
الأشياء تحدث والتنبؤ بما سوف يحدث في المستقبل . 


Creating an analysis services project : 


إنشاء مشاريع خدمات التحليل : لإنشاء لل Ys) : Dm‏ أن نقوم بإنشاء analysis services project‏ 
وحيث إذا نقوم تشكيل أو alae]‏ لمصادر البيانات وعرض مصدر البيانات وذلك للمشروع . 
مصدر البيانات يقوم بتعريف مصدر الاتصال ومعلومات التحويل التي تتصل بمصدر البيانات الموجودة في 
نموذج ال Dm‏ الأساسية : 
mining structures‏ 01011178 إضافة هياكل 

. تنقیب لمشروع خدمات التحليل‎ Analysis server project 
يمكنك أن تقوم بعملية إضافة هياكل تنقيبيه إليها‎ Analysis server project بعد أن تقوم بإضافة‎ 
. وكذلك واحدة أو أكثر من النماذج التنقيبة التي تعتمد منها على الأخرى‎ 
: الهياكل التنقيبية‎ 
OLAP : ( OIAP تشمل على جداول وأعمدة وتكون مشتقة من مصادر بيانات عرض متوفرا ومن عملية‎ 
. أي عملية التخيل المباشر من موقع الانترنت‎ ) Online Fanatical process 

Working with Dm models :‏ 
قبل أن نستطيع استخدام نماذج التنقيب التي تقوم أنت بتعريفها يجب عليك أن تقوم بعملية المعالجة لها وذلك 
الخدمات التحليل analysis services‏ 


تستطيع المرور بعملية تدريب البيانات من خلال الخوارزميات لإنشاء التنبؤات : creating‏ 
predictions‏ 

- الهدف الرئيسي من معظم مشاريع تنقيب البيانات يكون مستخدما لنماذج التنقيب وذلك لإنشاء التنبؤات بعد 
أن يقوم ب بعملية | ستكشاف ومقارنة نماذج التنقيب . 

- تستطيع أن تستخدم واحدة لإنشاء نماذج التنبؤات 


خدمات التحليل : 
تقوم بتزويدك بلغة الاستعلامات Dmx = Data miming Extension‏ 
عرف WS‏ من المسطلحات التالية Dmx - ssAsd)‏ ( التي تستخدم لعملية إنشاء التنبؤات 
SQL server Reporting :‏ 
بعد أن تقوم بإنشاء نماذج التنقيب بإمكانك أن توزع النتائج على مستوى أوسع » ويمكنك استخدام 
التقارير الموجودة في (SSAS)‏ لإنشاء التقارير والتي يمكن أن تقوم بتمثيل المعلومات المحتوية 
عليها نماذج التنقيب كذلك يمكن استخدام استعلام DMX)‏ ) كأقصى للتقارير . 
وتستطيع أن تأخذها كميزة لعملية الإثبات وتهيئة المميزات والتي تكون في خدمات التقارير 
Working programinatically unit Dmx‏ 
العمل برمجي مع Dmx‏ 
Dmx-i‏ تقوم بترويدك dae pall Dada‏ التي نظي أن eani‏ لأنشاة eld cu ji y‏ تقب 
البيانات كذلك بإمكانك أداء bac‏ مهمات باستخدام إتحاد كلا من Xm].‏ لعملية التحليل (ASSL)‏ أو 
باستخدام Analysis services languages‏ 
Analysis management object = Amo‏ تحليل كائنات إدارية . 
تشغيل حزمة SQI‏ : 
لكي يصبح Qu SQI server‏ بشكل اتوماتيكي كلما أقلع الحاسبو تقوم AVL‏ : 
نقوم بالدخول الي Servies‏ عن طريق ادوات النظام administrator too]‏ 
. نقوم بتحدید SQI server‏ تم نقوم بالدخول خصائص 
. من القائمة start up type‏ نقوم باختيار الخيار أوتوماتيك ) (Automatic‏ . 
. ثم نقوم بتحديد SQI server Agentn‏ من services‏ - فائدة يقوم بتشغيل التقارير 
والاستعلامات ثم ندخل إلي خصائصها ونعملها : أتوماتيك . 
تفعيل الخدمات الآخرة التابعة SQI server‏ : للعمل مع خدمات SQI server‏ يجب تفعيلها قبل 
العمل معها وبالغالب يتم تفعيل هذه الخدمات لتعمل معها يدوي بغرض تحيلي وتنقيب ( استخراج ( 
البيانات من قاعدة البيانات . 
ومن أهم هذه الخدمات الثانوية : 
SQI server Analysis services (SSAS)‏ هذه الخدمة تعمل على عملية تحليل البيانات ويمكن 
انشاء فيها Structure model‏ وها يعني انه يوجد مصدر بيانات Data Minig wizard‏ ) 
معالج تنقيب البيانات ) 
طريقة دخول ال server Analysis services (SSAS)‏ 501 : 
.١‏ نقوم بتشغيل البرنامج server Manegement studio‏ 501 . 
LY‏ نقوم بعملية الاتصال sacle;‏ البيانات وال server‏ 
ملاحظة ( يمكن تشغيل أكثر من قاعدة عن طريق سثقرثق وذلك عن طريق الزر options‏ ثم نقوم باختيار 
قاعدة بيانات الافتراضية ) 
وتتم عملية الاتصال ل server‏ من النوع Analysis service‏ 
.١‏ من القائمة server type‏ نقوم باختيار اسم الخادم المناسب المفعل في الحاسوب وعادة يكون اسم 
السيرفر المحلي هو نفس اسم حاسوبك . 


ويمكنك الدخول الي خوادم أخرى موجودة في الشبكة من النوع lan « wan‏ وذلك كالتالي : 
- من القائمة server name‏ نختار التبويب network service‏ 
- في حالة وجود شبكة من النوع Jan‏ فقط فلا يمكن الدخول فقط الي الاجهزة الموجودة في نفس 
المعمل دس PEN‏ 
* سوال عملي ( قم بالدخول الي اسم الخادم المسمى 3ءم الموجود في الشبكة وذلك عن طريق خادم من 
النوع Analysis server‏ 


daig ا ا ات‎ yl ECTETUR P 
minig 
TakeOffLine الأجراء‎ 
الاخرى الي الدخول إلى نفس هذه القاعدة حيث بعد هذا الإجراء سوف تكون عمل‎ eal All عدم تمكين‎ 
TakeOffLine ثم‎ Tasks بالضغط على زر الماوس الايمن في قاعدة البيانات ونضظغط‎ 
الي‎ instance عملية النسخ نقوم بعملية نسخ قاعدة البيانات من‎ : Copy database الاجراء الثاني‎ 
آخر وذلك لغرض حماية البيانات وتبقي كقاعدة حيث اذا ما تضررت القاعدة الحالية‎ 7 
copy database لاجراء عملية‎ 
1 وتتم عملية اجراءات النسخ لقاعدة البيانات‎ 
copy data آخر واختر‎ instance نقوم بتحديد قاعدة البيانات المراد قفلها إلى‎ . 
next نقوم بضغط‎ . 
source نقوم بتحديد اسم الخادم المصدر‎ . 
next ثم نقوم بتحديد نوع التحويل ثم‎ . 
نقوم بتحديد الخادم للهدف المراد نقل قاعدة البيانات الموجود المراد نقل قاعدة البيانات اليها‎ . 
instance المحتوى على‎ 
ثم نقوم باختيار الطريقة التي سوف نقوم باستخدامه في عملية النسخ‎ next نقوم بالضغط على‎ . 
. والنقل‎ 
هذه الطريقة سريعة ولاكنها‎ : use the attach and attach method الطريقة الأولى‎ (i 
offhinc تشترط أن تكون قاعدة البيانات على شكل‎ 
هذه الطريقة بطئية‎ : use the SQ] Management object method الطريقة الثانية‎ 
on line ولاكنها تعمل في وان كانت قاعدة البيانات‎ 
اذا ما فشلت عملية النسخ فإننا نقوم‎ instance لكي تجعل قاعدة البيانات تقوم بعملية الاتصال من جديد بال‎ 
» بتفعيل الخيار السابق‎ 
موجود في مسار ما‎ instance عملية اتصال قاعدة ما موجودة في مسار ما إلى‎ reattach ويقصد بعملية‎ 
. موجودا في الخادم العام‎ instance إلى‎ 
. ثم نقوم بتحديد قاعدة البيانات‎ next تقوم بالظغط على زر‎ .۷ 
online ملاحظة ( بحالة وجود مشكلة في عملية النقل في النموذج أعلاة نرجع الي قاعدة البيانت ونجعلها‎ 
. وبعد ذلك نرجع إلى مربع الحوار أعلاه ثم نختار الطريقة الثانية)‎ 
نقوم بكتابة اسم قاعدة البيانات الجديدة وإذا اردت استبدالها بقاعدة بيانات سابقة موجوده نسميها‎ A 
next بنفس الاسم لكي يحدث التبديل ثم‎ 
. مفعل‎ 501 server Agent ملاحظة ( لكي تنجح العملية كما يجب أن يكون‎ 
: لقاعدة البيانات‎ Attach عملية ال‎ 
الغرض في هذه العملية هو عملية اتصال قاعدة البيانات في الخادم وهي حاليا توجد في أي مسار > ودائما‎ 
. نقوم بالعملية في قاعدة البيانات عندما نقوم بتحميلها لزبون‎ 
Ags بالاتصال‎ Cilla dgaly لكي تستطيع‎ alls, 


استخدام الاذاة Analyze‏ عملية التحليل : وهى اذاة من cal sil‏ تنقيب البيانات : 
-١‏ تحدد قاعدة البيانات . 1 
-Y‏ من القائمة Tool‏ نختار Database wizard Analyze‏ 
-Y‏ ثم تظهر رسالة نختار الخيار الاول statistics‏ والغرض من هذا الختيار هوتحليل البيانات 
الموجودة في قاموس البيانات وتخزينها في قاموس البيانات ثم الظغط على زر next‏ 
طريق كصيدهار ees Lest‏ القذل + 
وعلي سبيل المثال سوف نقوم هنا باستخدام المستخدم scott‏ وتحديد خيرا ونقلها الي الجهه اليمنى 
تساعد selceted object‏ ثم الضغط على زر next‏ 
الثالى ثم كظهر ر سال تخر finish‏ ثم تظين رسالة clas‏ العملية, 


ناتي الآن الى الجانب العملي لتنقيب بيانات وسوف نستخدم للتطبيق 2005 Microsoft SQL Server‏ 

Mining structures 

Mining models 
bussiness intellegence development نقوم بالدخول الي البرانامج‎ -١ 
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(E) Oracle - OráHome90 (Fi) Documentation and Tutorials 
| Windows Messenger f ع‎ - 
% 3°" E) Oracle Installation Products (f) Performance Tools 


ug SQL Server Manage e Realtek Sound Manager SQL Server Business Intelligence Development Studio 


i. 3 Studio 8 
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¥isual Studio installed templates 
Visual Basic 0 
Visual C# gl Analysis Services Project Import Analysis Services 9.0 Datab.. 
Visual J# ital Integration Services Project „ Report Server Project Wizard 


Visual C++ E]Report Model Project (gl Report Server Project 
Other Project Types 


My Templates 


(Search Online Templates... 
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